یک سیستم نوین هوشمند تشخیص هویت نویسنده فارسی زبان بر اساس سبک نوشتاری - مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

نویسندگان

زینب فرهمندپور

zeinab farahmandpoor هومن نیک مهر

hooman nikmehr محرم منصوری زاده

moharram mansoorizade امید طیب زاده قمصری

omid tabibzadeh ghamsary

چکیده

پیشرفت سریع ارتباطات اینترنتی و استفاده ی نادرست از ناشناس بودن متون آنلاین، باعث به وجود آمدن مسائل امنیتی شده است. هویت ناشناس ابزارهای اینترنتی مانند ایمیل ها، وبلاگ ها و وب سایت ها به روش های ارتباط مورد علاقه ای برای کاربردهای جنایی تبدیل شده است. روابط سیاسی و اجتماعی جهان باعث توجه زیادی به زبان فارسی شده است. که این موضوع خود موجب فراوانی متون فارسی در اینترنت گردیده است. در این مقاله یک روش هوشمند writeprint معرفی شده است که به شناسایی یک نویسنده فارسی زبان بر اساس سبک نوشتاری او کمک می کند. در این تحقیق از ویژگی های واژگانی، نحوی، معنایی و وابسته به کاربرد، برای شناسایی هویت استفاده شده است. و کارایی انواع مختلف این ویژگی ها و همچنین اثرات روش های دسته بندی knn و delta به همراه ترکیب این روش ها با الگوریتم ژنتیک روی دو پایگاه داده ی جمع آوری شده بررسی شده است. در کنار سایر ویژگی ها برای پیاده سازی روش پیشنهادی یک pos tagger طراحی شده است که از ساختار کلمات برای تشخیص اسم، صفت و قید استفاده می نماید. آزمایشات انجام شده در این تحقیق نشان دادند که در بین روش های دسته بندی بررسی شده، ترکیب knn و الگوریتم ژنتیک دقت بالاتری را در تشخیص هویت مالک اثر ادبی تولید کرد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

نقش ارتباطات معنایی در بهبود نتایج یک سیستم پیشنهاد استناد- مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

With the increasingly growth of scientific documents in the Web, it is difficult to select a concerned document. A citation recommendation system receives a text and recommends documents to be cited by the text. Such recommendation helps a researcher in hitting his/her concerned texts. Based on sematic relations, this paper presents a new indicator to measure the similarity between documents an...

متن کامل

نقش ارتباطات معنایی در بهبود نتایج یک سیستم پیشنهاد استناد- مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

حجم فراوان و روبه رشد اسناد علمی منتشر شده بر روی وب، فرآیند تصمیم گیری و انتخاب اسناد مرتبط با یک زمینه تحقیقاتی را برای پژوهشگران دشوار کرده است. استفاده از کتابخانه های دیجیتال رایج با مشکلات مختلفی نظیر ناکارامدی جستجوی مبتنی بر کلمات کلیدی و ضعف معیارهای شباهت متنی مواجه است. راههکار دیگری که در سال های اخیر مورد توجه قرار گرفته است استفاده از سیستم های پیشنهاد استناد می باشد که با دریافت ...

متن کامل

توسعه روش SL با ترتیب KBO برای اثبات خودکار پایان‌پذیری سیستم بازنویسی ترم - مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

 The term rewriting systems (TRSs) is an abstract model of functional languages. The termination proving of TRSs is necessary for confirming accuracy of functional languages. The semantic labeling (SL) is a complete method for proving termination. The semantic part of SL is given by a quasi-model of the rewrite rules. The most power of SL is related to infinite models that is difficult f...

متن کامل

طراحی و پیاده سازی یک سیستم هوشمند تشخیص هویت بر اساس سبک نوشتاری فارسی

تشخیص هویت نویسنده، یک مساله ی سبک شناسی است که سعی می کند یک متن را که نویسنده ی آن ‏ناشناس است، به نویسنده ی واقعی آن متن نسبت دهد. این موضوع در زبان های مختلفی پیاده سازی شده و ‏مورد بحث قرار گرفته ولی در زبان فارسی این چنین به آن پرداخته نشده بود. آنچه در این پایان نامه مورد ‏بررسی قرار می گیرد طراحی و پیاده سازی یک سیستم تشخیص نویسنده بر اساس سبک نوشتاری فارسی ‏است. در این پایان نامه علاوه...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
محاسبات نرم

جلد ۱، شماره ۲، صفحات ۲۶-۳۵

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023